Логин
 
 
 
 

Статьи и обзоры

Follow idexpert_ru on Twitter


 
 
XI Форум Auto-ID & Mobility - решения для бизнеса

Smart Engines научилась распознавать рукописную “шиншиллу” из мемов про русский курсив

21.03.2025

Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы

Ученые компании Smart Engines обучили ИИ распознавать трудночитаемые рукописные слова, такие как “шиншилла”, без языкового контекста. Новая нейросеть не использует знаний о словах русского языка и учитывает только особенности сопряжения букв на изображении. Такой подход кардинально снижает вероятность галлюцинаций ИИ на редко встречающихся словах, включая имена собственные. Эта разработка вывела на новый уровень системы распознавания паспортов РФ, которые используются ведущими банками, сотовыми операторами и другими российскими компаниями.

Слово “Шиншилла” – своеобразный тест Тьюринга для систем распознавания рукописного текста на кириллице. Сложность задачи обусловлена тем, что при быстром и не очень аккуратном письме строчные формы букв “ш”, “л”, “и” становятся практически неразличимы. По этой причине слово “шиншилла” неоднократно упоминалось в мемах про сложность русского языка.

Нейросетевая архитектура «Да Винчи» не использует лингвистические механизмы — рекуррентные схемы, триграммы и словари. За счет этого она работает быстрее аналогов и занимает меньше места в памяти устройства. Но даже это не гарантирует переобучения языковому контексту. Для радикального сокращения риска галлюцинаций «Да Винчи» обучена на 1,2 млн строк рукописного текста, синтезированного с равномерным распределением сочетаний букв.

“Основной целью было создать метод ИИ, который умел бы читать такие сложные для прочтения рукописные слова, как «шиншила», но без использования языкового контекста. Это необходимо для распознавания документов - паспортов, штампов о регистрации и других. В них надо читать ровно то, что написано, а не то, что правильно с точки зрения языка”, – комментирует генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

Выход новой технологии приурочен к десятилетию выпуска первой системы распознавания паспорта РФ в видеопотоке на смартфоне. 17 марта 2015 года ученые Smart Engines первыми в мире реализовали возможность распознавания страниц основного разворота паспорта на мобильном телефоне в видеопотоке в режиме реального времени. Целевыми моделями в то время были iPhone 4S и Samsung Galaxy S3.

Подписывайтесь на наши новости в Telegram: https://t.me/idexpert

Читайте нас на VK: https://vk.com/idexpert_ru

Источник:  Пресс-служба Smart Engines


Рейтинг статьи

Возврат к списку



Материалы по теме:

Статьи и обзоры
Новости рынка и технологий

Продукты автоматической идентификации

Chainway C66
Chainway C66
Мобильный компьютер на базе OC Android
Chainway P100
Chainway P100
Высокопроизводительный промышленный планшет с поддержкой 5G
Chainway MC50
Chainway MC50
Высокопроизводительный мобильный компьютер с поддержкой 5G
Chainway U300
Chainway U300
Стационарный RFID-считыватель (Android 11)
Chainway MC95
Chainway MC95
Высокопрочный (IP68) мобильный компьютер промышленного класса
DASCOM DC-7600
DASCOM DC-7600
Карточный принтер с технологией ретрансферной печати
Chainway C61
Chainway C61
Надежный терминал сбора данных нового поколения
Chainway C72 UHF RFID
Chainway C72 UHF RFID
Мобильный UHF RFID считыватель на ОС Android
Chainway R1
Chainway R1
Высокопроизводительный считыватель / записывающее устройство с возможностью считывания в HF и UHF диапазонах

Все продукты >>>

 
XI Форум Auto-ID & Mobility - решения для бизнеса

Проекты и решения

События

Опрос





Комментарии